草庐IT

android - UTF-8不在webview android中编码html

全部标签

ruby - 使用 Nokogiri 从 HTML 获取父元素

我有以下HTML,我想获取文档中的父项。我使用Nokogiri进行解析:j_text="abcpqr>examplefindbyIDzzzznnnnnsfds"我做到了:doc=Nokogiri::HTML(j_text)现在我想要来自HTML文本上方的父元素,即,,,使用Nokogiri,我该怎么做? 最佳答案 当您在Nokogiri中加载该HTML片段时,它会自动将元素插入到具有嵌套“body”元素的根级“html”元素中。因此,您提供的HTML片段中节点的父级将是“正文”:doc=Nokogiri::HTML(j_text)d

Ruby 不兼容的字符编码

我目前正在尝试编写一个脚本来遍历输入文件并检查网站上的数据。如果它找到新数据,它会打印到它通过的终端,如果没有,它会告诉我它失败了。反之亦然删除的数据。它工作正常,直到我收到的输入文件包含“™”字符。然后当ruby​​到达该行时,它会吐出一个错误:PDAPWeb.rb:73:in`include?':incompatiblecharacterencodings:UTF-8andIBM437(Encoding::CompatibilityError)违规行是一个简单的检查,以查看该文本是否存在于页面上。ifbrowser.text.include?(program_name)其中prog

Ruby:是否可以在不对类名进行硬编码的情况下确定我的 Ruby 方法在其中执行的类?

我是Ruby的Nuby。我正在寻找一种方法来获取当前执行行的方法的包含类对象。如果不对类名进行硬编码,这可能吗?#hardcodedexampleclassAdefto_s"Iama"+A.to_s#Class"A"ishardcodedhere.IsthereanotherwaytoreferencetheclassA?endend我想也许self.class会起作用,但是当类被子类化时,它并没有给我我想要的东西。#FollowingOutputs=>IamaCamelIamaCamelIamaCamel#butIwant=>IamaCamelIamaMammalIamaAnimal

ruby - 如何不在 ruby​​ 中编写完整的模块路径?

假设我在一个非常长的模块路径中有一个类:sux=Really::Long::Module::Path::Sucks.new我能否以某种方式“导入”这个模块,这样我就可以直接使用这个类,而不必担心每次使用它时都要写这个路径?编辑:我知道在同一个模块中会让事情变得更容易。但在这种情况下,我不能在同一个模块中。 最佳答案 模块是ruby​​中的对象,因此您可以只引用较短的模块。Sux=Really::Long::Module::Path::SucksSux.new 关于ruby-如何不在rub

ruby 从任何编码到 ascii

我必须主要处理英文字母和所有标点符号,我不必担心欧洲口音。所以我唯一担心的是,当用户粘贴他从网上复制的内容时,例如,当我在控制台(在Win7上)中执行一个撇号时,它会输出"ItΓÇÖs"#它实际上在哪里"It's"所以我的主要问题是,是否有一种我可以在Ruby中使用的完全转换方法,它可以正确地替换所有,.;?!"'~`_-与ASCII计数器部分?我真的对编码知之甚少,如果您认为这是错误的问题(很可能是这种情况),请就我应该寻找的内容提出建议。谢谢 最佳答案 我在出版业工作,我们经常处理这个问题。我们在stringex上取得了成功ht

ruby - 使用 open-uri 和 nokogiri 在完全加载之前读取 HTML

我正在使用open-uri和nokogiri以及ruby​​来进行一些简单的网络爬虫。有一个问题,有时html在完全加载之前就被读取了。在这种情况下,我无法获取加载图标和导航栏以外的任何内容。告诉open-uri或nokogiri等待页面完全加载的最佳方法是什么?目前我的脚本是这样的:require'nokogiri'require'open-uri'url="https://www.the-page-i-wanna-crawl.com"doc=Nokogiri::HTML(open(url,ssl_verify_mode:OpenSSL::SSL::VERIFY_NONE))puts

ruby-on-rails - 在 Rails 中,如何使用字符串数组实现 HTML 选择菜单?

我有一个FinancialDocument#document_type模型属性。我想让用户从由字符串数组填充的HTML选择菜单中选择文档类型...doctypes=['Invoice','Packingslip','Other']对于每个选项,显示的标签和返回的值都是相同的。我查看了select和collection_select助手,但它们似乎适合选择子模型,而不仅仅是一个String值。我找不到如何让它们达到我的目的。这是我正在尝试的方法(我使用的是Haml,而不是Erb)...form_for(@financial_document)do|f|-doctypes=['Invoic

ruby - 在 Ruby 中使用 Nokogiri 解析 HTML

使用此HTML代码:....................如何使用Nokogiri选择类为1的第二个或第三个div? 最佳答案 您可以使用Ruby将大型结果集缩减为特定项目:page.css('div.one')[1,2]#Twoitemsstartingatindex1(2nditem)page.css('div.one')[1..2]#Itemswithindicesbetween1and2,inclusive因为Ruby索引从零开始,所以你必须注意你想要的项目。或者,您可以使用CSS选择器来查找nthitem:#Second

Ruby,将字符串与 UTF-8 字符进行比较时出现问题

我有这2个UTF-8字符串:a="N\u01b0\u0303"b="N\u1eef"它们看起来很不一样,但渲染后是一样的:irb(main):039:0>puts"#{a}-#{b}"Nữ-Nữa版本是我存储在数据库中的版本。b版本是来自浏览器的POST请求,我不知道为什么浏览器会发送不同的UTF8字符组合,而且这种情况并不总是发生,我不能'在我的开发环境中重现该问题,它发生在生产环境中并且占总请求的百分比。情况是我尝试比较它们,但它们返回false:irb(main):035:0>a==b=>false我尝试过不同的方法,例如强制编码:irb(main):022:0>c.force

ruby - 如何在 Ruby 中列出有效的 Iconv 编码?

如何在windows7下获取Ruby1.9.1中的有效Iconv编码列表? 最佳答案 也许这会有所帮助:putsEncoding.listputsEncoding.aliases它返回一个加载的编码列表,以及一个编码别名的散列:ASCII-8BITUTF-8US-ASCIIBig5CP949Emacs-MuleEUC-JPEUC-KREUC-TW...{"BINARY"=>"ASCII-8BIT","CP437"=>"IBM437","CP737"=>"IBM737","CP775"=>"IBM775","IBM850"=>"CP8